Workshop Ciencia Abierta
3 de enero de 2024
Es la práctica de conducir estudios científicos o basados en datos de tal manera que permita a otros replicar o reproducir los resultados usando los mismos datos, códigos y metodologías.
Los autores entregan todos los datos necesarios y los códigos computacionales para realizar el análisis nuevamente, recreando los resultados.
Un estudio que llega a los mismos hallazgos científicos que otro estudio, recolectando nuevos datos (posiblemente con diferentes métodos) y completando nuevos análisis.
Reproducibilidad Computacional: Cuando se proporciona información detallada sobre el código, software, hardware y detalles de la implementación
Reproducibilidad Empírica: Cuando se proporciona información detallada sobre experimentos y observaciones científicas empíricas no computacionales. En la práctica, esto se ocurre al hacer que los datos y los detalles de cómo se recopilaron estén disponibles de forma gratuita.
Reproducibilidad Estadística: Cuando se proporciona información detallada, por ejemplo, sobre la elección de pruebas estadísticas, parámetros del modelo y valores de umbral. Esto se relaciona principalmente con el registro previo del diseño del estudio para evitar la práctica de p-value hacking y otras manipulaciones.
| Ventajas | Dificultades |
|---|---|
| Historial completo del proyecto | Incentivos limitados |
| Colaboración y Revisión | Sesgo de las investigaciones hacia hallazgos novedosos |
| Evita la desinformación | Mayores estándares |
| Escritura eficiente | Se aplican mayores estándares a las investigaciones reproducibles |
| Reconocimiento justo | No es considerado para las promociones |
| Asegura la continuidad del trabajo | Variabilidad en el rendimiento de los software utilizados |
| Que una investigación sea reproducible no significa que esté correcta | |
| Toma más tiempo |
Solo una proporción muy pequeña de los datos originales se publica en revistas convencionales o investigaciones públicas. A pesar de las políticas existentes sobre el archivo de datos, en la actualidad, los datos se almacenan principalmente en archivos privados, no en repositorios institucionales seguros, y se pierde a ellos por parte del público general.
Esta falta de intercambio de datos es un obstáculo para la investigación internacional (ya sea académica, gubernamental o comercial) por dos razones principales:
Generalmente es difícil o imposible reproducir un estudio sin los datos originales.
Los datos no pueden ser reutilizados o incorporados en nuevos trabajos por otros investigadores si no pueden acceder a ellos.
Cuando un proyecto es de código abierto, cualquiera puede ver, usar, modificar y distribuir el proyecto para cualquier propósito. Estos permisos se aplican a través de una licencia de código abierto
¿Cómo los software de código abierto benefician la investigación?
Re-usable
Comprobable
Colaborativo
https://posit.co/download/rstudio-desktop/
Existen otras alternativas más génericas como Visual Studio Code, un editor de código para múltiples lenguajes. Sin embargo, al no ser un software especializado en R, requiere utilizar extensiones para lograr las funcionalidad que otorga RStudio.
Before we dive a bit deeper, here is a simple example of the clean theme in action.
Next, we’ll take a brief tour of some theme components.
TinyTex
While reveal.js presentations are HTML format, we will show an example of how to embed LaTeX tables as images. This requires a working Tex distribution, of which TinyTex provides by far the easiest and lightest integration with Quarto. More details here.
Here we have an unordered list.
And next we have an ordered one.
To emphasize specific words or text, you can:
.alert class, e.g. important note..fg class for custom colour, e.g. important note..bg class for custom background, e.g. important note.To cross-reference, you have several options, for example:
.button class provided by this theme, e.g. AppendixCitations follow the standard Quarto format and be sourced from BibLaTex, BibTeX, or CLS files. For example:
Topic 1: Spatial Frictions (Fajgelbaum et al. 2018; Hsieh y Moretti 2019; Moretti 2011)
Topic 2: Blah (Suárez Serrato y Zidar 2016)
Quarto provides dedicated environments for theorems, lemmas, and so forth.
But in presentation format, it’s arguably more effective just to use a Callout Block.
Regression Specification
The main specification is as follows:
\[ y_{it} = X_{it} \beta + \mu_i + \varepsilon_{it} \]
Here is a long sentence that will wrap onto the next line as it hits the column width, and continue this way until it stops.
Some other text in another column.
A second paragraph.
Multicolumn support is very flexible and we can continue with a single full span column in the same slide.
Note that sub- and multi-panel figures are also natively supported by Quarto. See here.
Quarto offers excellent table support, with further customization via user libraries. Let’s illustrate with a regression example:
library(fixest)
mods = feols(
rating ~ complaints + privileges + learning + csw0(raises + critical) + advance,
data = attitude
)
dict = c("rating" = "Overall Rating",
"complaints" = "Handling of Complaints",
"privileges" = "No Special Priviledges",
"learning" = "Opportunity to Learn",
"raises" = "Performance-Based Raises",
"critical" = "Too Critical",
"advance" = "Advancement")If you use modelsummary with this Quarto theme, we advise setting the gt backend for a cleaner aesthetic. More details here.
fixest’s powerful native tabling functions were designed for LaTeX output. But we can use the markdown = TRUE option to make them work with this theme too. (Details here.) Quick notes:
tinytex & pdftools packages first.output: asis.You can use the {.background-image} container environment to completely fill the slide background with an image.
Ideally, your figure will be the same aspect ratio as the screen that you’re presenting on.
Note: Simple flight data example using threejs. There are many interactive plotting options beyond this. (More details.)
The Quarto reveal.js clean theme aims to be a minimal and elegant presention theme.
We have highlighted some theme-specific components. But all of the regular reveal.js functionality is supported (chalkboard, etc.)
Install the theme:
Use these demo slides as a template:
| Unique (#) | Missing (%) | Mean | SD | Min | Median | Max | ||
|---|---|---|---|---|---|---|---|---|
| rating | 22 | 0 | 64.6 | 12.2 | 40.0 | 65.5 | 85.0 | |
| complaints | 23 | 0 | 66.6 | 13.3 | 37.0 | 65.0 | 90.0 | |
| privileges | 24 | 0 | 53.1 | 12.2 | 30.0 | 51.5 | 83.0 | |
| learning | 23 | 0 | 56.4 | 11.7 | 34.0 | 56.5 | 75.0 | |
| raises | 21 | 0 | 64.6 | 10.4 | 43.0 | 63.5 | 88.0 | |
| critical | 21 | 0 | 74.8 | 9.9 | 49.0 | 77.5 | 92.0 | |
| advance | 20 | 0 | 42.9 | 10.3 | 25.0 | 41.0 | 72.0 |